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Artykuł skupia się na metodologicznych osobliwościach praktyki badawczej (badania naukowe 
i badania diagnostyczne) psychologii klinicznej. Autor wskazuje na typowe odstępstwa tej praktyki 
od standardów metodologicznych współczesnej psychologii — zwłaszcza tych, które wpisane zosta- 
ły we wzorzec diagnozy opartej na dowodach empirycznych i praktyki psychologicznej opartej na 
dowodach empirycznych: lekceważenie prymarnej roli empirycznych teorii psychologicznych, 
zbyt częste odstępstwa od standardów psychometrycznych w procedurach konstruowania i stoso- 
wania testów psychologicznych (bywa, że są to pseudotesty, jak np. Test Drzewa Kocha). W arty- 
kule podkreślono ważność trafności teoretycznej testu psychologicznego. Podniesiono też problem 
zapewniania badaniom naukowym prowadzonym przez klinicystów trafności wewnętrznej i ze- 
wnętrznej. 


Słowa kluczowe: diagnoza psychologiczna; teoria psychologiczna; proces badawczy; EBA; EBPP; 
trafność wewnętrzna; trafność zewnętrzna; psychologia kliniczna. 


Do podjęcia tego tematu skłoniła mnie powtórna, po około trzydziestu la- 
tach, lektura klasycznego artykułu jednego z najoryginalniejszych psychologów 
klinicznych, Saula Rosenzweiga (1907-2004)'. Mam na myśli jego artykuł: „The 
experimental situation as a psychological problem” (Rosenzweig, 1933). Rosen- 
zweig w swojej pracy pisał o „osobliwościach” (peculiarities) badań ekspery- 
mentalnych w psychologii. W skrócie, zwrócił on wagę na to, że: 

— badacz staje się elementem sytuacji badawczej; 
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— wpływ na zachowanie się osoby badanej w sytuacji badawczej mają takie 
zmienne związane z osobą badaną ją charakteryzujące, jak: osobowość, motywa- 
cja itp.; 

— zawiązuje się interakcja: badacz-osoba badana. 

Ja zaś chciałbym — wykraczając poza materię opisaną przez S. Rosenzweiga 
i, tak po prostu, ją akceptując (por. też: Brzeziński, 1994) — w tym szkicu meto- 
dologicznym rozważyć problem osobliwości badań (ale oglądanych z perspek- 
tywy „twardych standardów metodologicznych) — naukowych i diagnostycz- 
nych — prowadzonych przez psychologów klinicznych (dalej: klinicystów). Zaś 
zależności opisane przez Rosenzweiga zaliczyłbym raczej do psychologii spo- 
tecznej badania psychologicznego — że nawiążę do tytułu głośnej w latach 70. 
XX wieku książki Arthura G. Millera (1972): The social psychology of psycho- 
logical research. 

Rzecz jasna, psychologia kliniczna jest działem psychologii po prostu (ro- 
zumianej jako nauka empiryczna, i nie inaczej). Od razu też zaznaczę, że nie jest 
ona odrębną psychologią. W tej kwestii zajęliśmy (Brzeziński i Toeplitz- 
Winiewska, 2008, s. 305; też: Brzeziński, 1996, 2013) następujące stanowisko: 


W „odwiecznym” sporze psychologów uniwersyteckich z psychologami praktykami (bo tu 
mniej więcej biegnie linia demarkacyjna) zajmujemy [...] analogiczne stanowisko do wyra- 
żonego przez Matarazzo (1987) czy Ellisa (1992), a dające się wyrazić słowami następującej 
deklaracji: jest tylko jedna psychologia, a nie wiele psychologii stosowanych; jej ustalenia 
empiryczne są stosowane w różnych dziedzinach praktyki społecznej — jako odpowiedź sfery 
nauki na zgłaszane zapotrzebowania społeczne. 


Zatem — i nie jest to tylko mój punkt widzenia — „osobliwość? metodolo- 
giczna praktyki badawczej i diagnostycznej psychologii klinicznej nie jest zwią- 
zana z rozwiązywaniem przez nią specyficznych „„zamówień” płynących ze sfery 
praktyki społecznej (wedle schematu opisanego przeze mnie w: Brzeziński, 
2013). Pod tym bowiem względem (innymi słowy: z tego poziomu ogólności 
rozpatrując ów problem) nie różni się ona od tak wyspecjalizowanych, nachylo- 
nych praktycznie działów psychologii, jak psychologia pracy, psychologia peni- 
tencjarna czy psychologia wychowawcza. Podkreślmy zatem raz jeszcze, że 
wymienione przeze mnie, tytułem przykładu, nachylone praktycznie „sub-psy- 
chologie” nie są odrębnymi, w sensie metodologicznym, psychologiami. Nie 
oznacza to jednak, że praktyka badawcza (naukowa i diagnostyczna) klinicystów 
nie jest szczególnie podatna na występowanie odstępstw od standardów meto- 
dologicznych obowiązujących w psychologii po prostu. O owym nachyleniu, 
charakteryzującym się lekceważeniem empirycznych teorii psychologicznych 
i, w konsekwencji, dryfowaniu w stronę paranauki, chciałbym podyskutować. 
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Rzecz jasna niezauważanie współczesnych standardów metodologicznych, lek- 
ceważenie empirycznych teorii psychologicznych czy nadmierne przywiązanie 
do osobistych doświadczeń (praktyki) klinicystów jako głównego źródła wiedzy 
diagnostycznej nie jest jedyną osobliwością psychologii klinicznej. Ale nie 
o wszystkim w tak krótkim opracowaniu można napisać. 


Od teorii naukowej do badania empirycznego, 
ale nie bez teorii 


Przy różnych okazjach psychologowie (zwłaszcza ci, którzy postulują wyko- 
nywanie zawodu psychologa w perspektywie poważnej teorii psychologicznej) 
zwykli powoływać się na wypowiedzi słynnych uczonych eksponujących zna- 
czenie teorii w skutecznym uprawianiu praktyki (np. klinicznej — diagnostyka 
czy psychoterapia). Swoistą karierę wśród psychologów zrobiła wypowiedź fizy- 
ka, Roberta Kirchhoffa (dość często przypisywana, niesłusznie, psychologowi — 
Kurtowi Lewinowi): „Najpraktyczniejszą rzeczą jest dobra teoria”. Można też 
przywołać znane wypowiedzi: socjologa, Davida Silvermana (2007, s. 31): „Bez 
teorii takie zjawiska, jak «płeć», «osobowość», «rozmowa» lub «przestrzeń», nie 
mogą być zrozumiałe na gruncie nauk społecznych. W tym sensie, bez teorii 
nie mamy czego badać”, czy biologa, Frangois'a Jacoba (1973, s. 32): „W wy- 
mianie między teorią a doświadczeniem teoria zawsze zaczyna dialog jako 
pierwsza. To ona wyznacza postać pytania, a więc również granice odpowiedzi”. 

Zanim jednak zaakcentuję relację „teoria-doświadczenie (praktyka)”, odnie- 
sioną do postępowania klinicystów, przedstawię wpierw standard metodologicz- 
ny, wedle którego regulowane jest współczesne postępowanie badawcze w psy- 
chologii (szerzej: w naukach społecznych). Prezentuje go Rysunek 1, na którym 
wyeksponowano teoretyczne składniki postępowania badawczego (przynajmniej 
tak, jak ja to widzę). 

Zacznijmy od tego, że postępowanie badawcze jest zanurzone” w kontek- 
ście teoretycznym. Poza nim badanie, czy to naukowe, czy to diagnostyczne, być 
może — zabrzmi to mocno, ale tak uważam — nie ma żadnego sensu; zwłaszcza 
ów bezsens ujawnia się szczególnie wyraziście, gdy klinicyści zabierają się za 
„poprawianie” psychiki swoich klientów, a jedyne, co mają im do zaoferowania, 
to własne „doświadczenie (po co im zatem potrzebna etykietka: „psycholog ?). 
Problem jednak z teorią psychologiczną, metodologicznie poprawną i znacze- 
niowo nośną. Tych nie mamy, niestety, w psychologii zbyt wiele. Ale, w co chcę 
wierzyć, wraz ze wzrostem świadomości metodologicznej psychologów (w czym 
niebagatelną rolę odgrywają studia psychologiczne prowadzone na dobrych, 
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badawczo zorientowanych — tu upomniałbym się o przeszczepienie na grunt pol- 
ski idei amerykańskich research universities) prawdziwe teorie będą wypierać 
ich atrakcyjnie opakowane harlekinowe imitacje. 


TEORIA PSYCHOLOGICZNA 


FAZA I 
PROBLEM 
HIPOTEZA 

Definiowanie zmiennych 


FAZA VI 
WNIOSEK BADAWCZY 
Interpretacja wyniku 


MODELE 
STATYSTYCZNY 
PSYCHOMETRYCZNY 


FAZA V 
Wniosek 
statystyczny 


FAZA II 
Operacjonalizacja 
zmiennych 


FAZA IV 
Ilościowa 
analiza danych 


FAZA III 
PLAN BADANIA 


Rysunek 1. Schemat postępowania badawczego. 


Teoria dostarcza badaczowi języka — z jego „gramatyką” i „słownikiem” — 
w którym można budować sensowne (w sensie psychologicznym) zdania. Te zaś 
służą nie tylko do opisania i wyjaśniania zjawisk, ale też jako teoretyczna podpo- 
ra świadczonej przez klinicystów profesjonalnej pomocy. Nauka jest wielopara- 
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dygmatyczna (i psychologia też). Badacz dokonuje wyboru (najlepiej, gdy jest 
on w pełni uświadamiany) między paradygmatami (w sensie: Kuhn, 2001). 
Opowiedzenie się za jednym z paradygmatów umożliwia „zejście” na niższy 
poziom analizy teoretycznej i analizy empirycznej. Tutaj jednak łatwo popaść 
w kłopoty, gdy chciałby on łączyć elementy teorii zaczerpniętych z różnych, 
wzajemnie wykluczających się paradygmatów. Otóż wszystkie zmienne teore- 
tyczne wprowadzone do teorii muszą być definiowane w języku tego samego 
paradygmatu. Badacz powinien przestrzegać podstawowej zasady: zasady nie- 
sprzeczności paradygmatycznej. Klinicyści, na ogół prowadzący badania na po- 
ziomie subparadygmatycznym, nie zawsze zdają sobie sprawę z ważności owej 
zasady. W języku danej teorii lub teorii niesprzecznych ze spajającym je para- 
dygmatem definiuje się zmienną zależną oraz zmienne niezależne tworzące ob- 
raz przestrzeni zmiennych istotnych dla danej zmiennej zależnej O(Py). Z tak 
zdefiniowanych zmiennych badacz formułuje problemy badawcze i hipotezy 
badawcze (Faza I). 

Każda teoria psychologiczna wymaga zinterpretowania empirycznego. Ter- 
miny (zmienne) teoretyczne muszą być powiązane z terminami obserwacyjnymi. 
Mówiąc inaczej, przejście do Fazy II wymaga nadania sensu empirycznego 
zmiennym teoretycznym. Bardzo ważna jest więc adekwatna do założeń teorii 
operacjonalizacja wymiarów skonstruowanego przez badacza O(Py). Program 
operacjonalizacji zmiennych ważnych dla Y, jak i dla samej Y musi być wywie- 
dziony z teorii i — w szczególności — z nią niesprzeczny. Metodologicznie niepo- 
prawny jest taki program operacjonalizacji zmiennych, który odwołuje się do 
różnych teorii (a dokładnie — do definicji zmiennych teoretycznych zbudowa- 
nych na gruncie teorii między sobą nieuzgodnionych (pochodzących z różnych 
paradygmatów). No bo jak pogodzić metodę Hermanna Rorschacha (jaka empi- 
ryczna teoria psychologiczna ją usensawnia?) z kwestionariuszem BDI Aarona 
Becka? Oczywiste jest też i to, że język interpretacji rezultatów pomiarów jest 
językiem tej samej teorii (lub z nią niesprzecznej), w której zdefiniowano zmien- 
ne i sformułowane na jej gruncie hipotezy badawcze. Badacz jest więc zobowią- 
zany do przestrzegania zasady zgodności programu operacjonalizacji z progra- 
mem teoretycznym. 

Stosowane, dość chętnie, przez klinicystów testy psychologiczne czy niezli- 
czone kwestionariusze osobowości wymagają kilka zdań komentarza (pomijam 
tu popularne w środowisku klinicystów tzw. metody projekcyjne: metodę Ror- 
schacha, Test Apercepcji Tematycznej czy Test Zdań Niedokończonych jako 
metody o wątpliwej wartości naukowej). Szczególnie popularna w tym środowi- 
sku jest Skala Inteligencji Davida Wechslera, i to od momentu skonstruowania 
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przez Wechslera w 1939 roku jej pierwszej wersji: Wechsler-Bellevue Intelligen- 
ce Scale W-B. Klinicyści posługują się nią nie tylko jako miarą IQ, ale też jako 
swoistym testem osobowości i klinicznych odchyleń od normy (por. Wechsler, 
1941/1998; Rapaport, 1945; Zimmerman i Woo-Sam, 1973; Frank, 1984; Kowa- 
lik, 1998; Tulsky, Saklofske, Chelune i in., 2003). 

Skale Inteligencji D. Wechslera są przykładem metody, która została skon- 
struowana na podstawie doświadczeń klinicznych i intuicji diagnostycznych jej 
twórcy, który „pod jednym dachem” zgromadził najbardziej przydatne w diagno- 
styce psychologicznej testy, tworząc z nich swoistą baterię testów (Boake, 2002). 
W sensie „teoretycznym” spajała ją zaproponowana przez niego definicja inteli- 
gencji jako: 

[...] jest to zagregowana (ogólna) zdolność jednostki do podejmowania działań celowych, ra- 

cjonalnego myślenia i do efektywnego radzenia sobie we własnym środowisku. Jest ona glo- 

balna, ponieważ charakteryzuje zachowanie jednostki jako całości, jest zagregowana, gdyż 
składa się z elementów (zdolności), które chociaż nie są całkowicie niezależne, ale są jako- 


ściowo odróżniane. Dokonując pomiaru tych zdolności, dokonujemy w efekcie oszacowania 
poziomu inteligencji (Wechsler, 1939/1998, s. 16). 


To, co psychologowie próbowali później zrobić, to zrekonstruować podstawy 
teoretyczne tej najbardziej chyba w Świecie znanej metody testowej. Jak napisa- 
no w przewodniku do Wechsler Adult Intelligence Scale WAIS-III z 1997 r.: 


Testów Wechslera nie tworzono w oparciu o teorię — być może z wyjątkiem teorii g Spearmana 
(1927), czy też ogólnej teorii inteligencji — lecz w oparciu o ujęcia praktyczne i kliniczne. [...] 
W zamierzeniu Wechslera, testy inteligencji miały być sposobem na uzyskanie wglądu 
w osobowość jednostki. Wiele lat po powstaniu skal Wechslera snuto szeroko zakrojone teore- 
tyczne spekulacje na temat natury i znaczenia tych testów oraz ich wyników, jednak pierwotnie 
testy te tworzone były bez odniesienia do teorii (Kaufman i Lichtenberger, 1999, s. 3). 


Przytoczony tu fragment wskazuje na brak oryginalnych teoretycznych pod- 
staw nie tylko tej wersji Skali Inteligencji, lecz także wersji ją poprzedzających 
(por. Hornowska, 1988). W latach, które minęły od daty opublikowania Skali 
Inteligencji Wechsler-Bellevue, podejmowano próby dokonania ex post rekon- 
strukcji teoretycznych podstaw skal Wechslerowskich. Próbowano „ulokować” 
testy składające się na baterię Wechslerowską w ramach Charlesa Spearmana 
teorii czynnika g (badanie nasycenia czynnikiem g poszczególnych testów — por. 
Leckliter, Matarazzo i Silverstein, 1986). Dwie znaczące teorie inteligencji, 
z którymi usiłowano powiązać testy Wechslera, to: Raymonda B. Cattella i Johna 
L. Horna teoria płynnej i skrystalizowanej inteligencji oraz Joya P. Guilforda 
model struktury intelektu. Także w przewodniku do WAIS-III i WAIS-IV wymie- 
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nia się te próby szukania teoretycznych podstaw Wechslera Skali Inteligencji 
(por. Kaufman i Lichtenberger, 1999; Lichtenberger i Kaufman, 2009). 

Jeśli zaś chodzi o kwestionariusze osobowości, to z trzech, wymienianych 
przez Bogdana Zawadzkiego (2006, s. 77), strategii budowy kwestionariuszy: 
teoretycznej (zwanej też dedukcyjną), zewnętrznej (zwanej też kryterialną) 
i wewnętrznej (zwanej też indukcyjną) zdecydowanie zgodna z podstawowym 
założeniem, iż to teoria poprzedza operacjonalizację zmiennych, jest strategia 
pierwsza. Dziś, po opublikowaniu przełomowej w psychometrii pracy, która 
doprowadziła do uwzględnienia jeszcze jednej, najważniejszej odmiany trafności 
— trafności teoretycznej (construct validity) (Cronbach i Meehl, 1955; też: Cron- 
bach, 1989), nie mamy wątpliwości, iż poza empiryczną teorią psychologiczną 
test jest tylko bezwartościową podróbką. Odnosząc się do owej klasycznej pracy 
Lee J. Cronbacha i Paula E. Meehla, Drew Westen i Roberta Rosenthala (2003, 
s. 608) napisali dość znamienne słowa o trafności teoretycznej i jej miejscu we 
współczesnej myśli psychologicznej, z którymi nie sposób się nie zgodzić: 


Trafność teoretyczna jest jednym z najważniejszych pojęć w psychologii. Stanowi istotę 
każdego badania, w którym badacze używają narzędzia pomiarowego jako wskaźnika zmien- 
nej nie podlegającej bezpośredniej obserwacji (takiej jak np. inteligencja, agresja czy pamięć 
robocza). Jeśli test psychologiczny (lub szerzej: procedura psychologiczna, w tym również 
manipulacja eksperymentalna) nie wykazuje trafności teoretycznej, wyniki otrzymane za po- 
mocą tego testu lub procedury będą trudne do zinterpretowania [...]. 


Podobnie autorzy rozszerzenia klasycznej teorii testów uważają, iż trafność 
teoretyczna jest, jak napisali w swoim fundamentalnym dziele (por. Lord 
i Novick, 1968, s. 278), „najważniejszą właściwością testu”. Nie mamy wątpli- 
wości, że jest to najważniejszy aspekt ustalania trafności testu. 

Mówiąc krótko, test, który nie jest wywiedziony z teorii empirycznej, nie jest 
godny tego miana. Jednym z uznanych sposobów jej ustalania jest zaproponowa- 
na przez Donalda T. Campbella i Donalda W. Fiske go (Campbell i Fiske, 1959) 
procedura badania trafności zbieżnej i różnicowej poprzez analizę macierzy 
„wielu cech — wielu metod” (convergent and discriminant validation by the multi 
trait — multi method matrix). 

Rysunek 1 ukazuje, że do empirycznej teorii psychologicznej, która przesą- 
dza o trafności teoretycznej testu, dołączają jeszcze dwie, nie-psychologiczne 
teorie (modele) — statystyczna (określająca ramy interpretacji ilościowej wyniku 
testowego) oraz psychometryczna, w ramach której konstruowany jest test i na 
gruncie której określane są podstawowe parametry dobroci psychometrycznej 
testu — przede wszystkim jego rzetelność i wielkość błędu standardowego po- 
miaru. Dzięki nim możliwe jest budowanie przedziału ufności dla wyniku praw- 
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dziwego (według klasycznej teorii testów Harolda O. Gulliksena, 1950). Jego 
znajomość jest niezbędna dla prawidłowej interpretacji wyniku testowego (por. 
AERA/APA/NCME, 1999/2007). Niestety, znajomość standardów statystycz- 
nych i psychometrycznych nie jest najmocniejszą stroną klinicystów. Znaczna 
ich część jest przekonana o swojej klinicznej nad-kompetencji i odrzuca podej- 
ście statystyczne — tak jakby przed laty nie ukazała się burząca te naiwne prze- 
konania głośna książka Paula E. Meehla: Clinical versus statistical prediction. 
A theoretical analysis and a review of the evidence (Meehl, 1954). 

W Fazie III przygotowany jest plan badania empirycznego. Tu niezbędna jest 
znajomość podstaw statystycznych badania eksperymentalnego i korelacyjnego — 
np. model ANOVA/MANOVA dla eksperymentalnych badań (z odwołaniem się 
do zasady randomizacji). I znowu, bez znajomości modeli psychometrycznych 
i statystycznych niemożliwe będzie poprawne zrealizowanie Fazy IV i V badania. 

W Fazie VI badania zinterpretowany wynik (wniosek statystyczny) użytej 
metody statystycznej (miary korelacji, testy istotności różnic) powinien być 
przekształcony na wniosek badawczy. Piszę o tym, gdyż nazbyt często badacz 
zadowala się stwierdzeniem, iż potwierdziła się jego hipoteza o zachodzeniu 
związku między zmiennymi czy o istotności różnicy między średnimi warto- 
ściami zmiennej zależnej w porównywanych grupach: eksperymentalnej i kon- 
trolnej. ,„„Sukcesem” badawczym jest otrzymanie poziomu istotności p = 0,05. 
Dobrze, gdy informacja o wartości p będzie uzupełniona informacją o wartości 
wielkości efektu ES (effect size; np. współczynnik d Cohena zastosowany do 
wyników testu t Studenta), czyli o rzeczywistej sile oddziaływania zmiennej 
X na zmienną Y (od kilku lat jest to standardowe wymaganie stawiane autorom 
tekstów empirycznych; por. APA, 2010; też: Wilkinson and Task Force on Stati- 
stical Inference, 1999). Wartości ES powinny być zinterpretowane przedziałowo 
(JARS Group, 2008; Wilkinson, 1999). 

Nie stawiam znaku równości między wnioskiem statystycznym (wyżej wska- 
zana sekwencja: wartość statystyki testowej, np. „t Studenta poziom istotności 
statystycznej, np. nie przewyższający p = 0,05 > wartość ES, np. d Cohena”) 
i wnioskiem badawczym. Podzielam stanowisko zajęte przez Bruce'a M. Kinga 
i Edwarda W. Miniuma (King i Minium, 2009, s. 25) w kwestii podziału wnio- 
sków na: wnioski statystyczne (statistical conclusions) i wnioski badawcze (rese- 
arch conclusions). Dodałbym jeszcze dwa uzasadnienia dla tego rozróżnienia. 
Pierwsze: ocena warunków, w których zastosowano dany test statystyczny; czy 
miały one wpływ na jego wynik. Porównywane próby nie są przecież, tak na- 
prawdę, pobrane według losowania zwrotnego z populacji (a takie jest założenie 
modelu statystycznego testu istotności). Czy rzeczywiście badacz kontrolował 
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wszystkie wpływy zewnętrzne, które mogły zniekształcać zachowanie się osób 
badanych w sytuacji badawczej? Oczywiście, że nie. Czy w badaniach o charak- 
terze eksperymentalnym stosował się do zasady randomizacji? Trzeba zatem 
wrócić do Fazy III i krytycznie przyjrzeć się planowi badania. Przykład: gdy 
zachodzi uzasadnione podejrzenie, że w badaniu eksperymentalnym może wy- 
stąpić efekt pretestu, to badanie powinno być przeprowadzone według planu 
Solomona. Drugie: ocena konsekwencji praktycznych zaakceptowanego przez 
badacza ryzyka popełnienia błędu I” (zawsze w fazie planowania badania, a nie 
już po jego zakończeniu!). Zbyt rygorystyczny poziom p może sprawić, że „uto- 
pimy” ciekawą hipotezę. Z kolei zbyt liberalny poziom p może doprowadzić do 
upowszechnienia się fałszywego wyniku, który będzie stanowił podstawę dla 
jakiejś, powiedzmy, procedury terapeutycznej, która może okazać się szkodliwa 
(np. źle sprawdzony lek, który okaże się toksyczny). Może zatem nie trzymać się 
sztywno poziomu p = 0,05? Może czasami trzeba sięgnąć po p = 0,001, a czasem 
wystarczy p = 0,10 (np. w badaniach typu eksploracyjnego)? 

Tu też — zwłaszcza w kontekście badań prowadzonych przez klinicystów 
raczej w warunkach terenowych (np. kliniki) aniżeli w ściśle kontrolowanych 
warunkach laboratoryjnych — trzeba zaakcentować ważność trafności zewnętrz- 
nej (zwłaszcza!) i trafności wewnętrznej planu badania. Z jednej strony, w trosce 
o wysoką trafność wewnętrzną, należałoby — w jak największym stopniu — izo- 
lować badanie od zakłócających wpływów zewnętrznych i przeprowadzić je 
w warunkach laboratoryjnych, z odwołaniem się do zasady randomizacji (mak- 
symalizacja trafności wewnętrznej). Z drugiej strony taka izolacja, bywa że do- 
prowadzona do perfekcji, czyni je „odrealnionym”, „sztucznym”, o mocno obni- 
Żonej trafności zewnętrznej. Wyjście z laboratorium pogarsza trafność we- 
wnętrzną badania, ale poprawia jego trafność zewnętrzną. Jest to jeden z pod- 
stawowych problemów badań nad psychoterapią, prowadzonych według dwóch 
standardów: efficacy vs effectiveness (por. np. Hunsley, Elliott i Therrien, 2013). 

Niestety, chęć sprostania wysokim standardom metodologicznym, dla za- 
pewnienia badaniu klinicznemu wysokiej trafności wewnętrznej, na ogół nie 
idzie w parze z uwzględnieniem wysokiej trafności zewnętrznej tego badania. 
Trafność wewnętrzna wymaga dużej precyzji pomiarowej, grup kontrolnych, 
randomizacji, izolacji od wpływów zewnętrznych itp. Kryteria trafności we- 
wnętrznej spełniają badania typu RCT (Randomized Controlled Trials). Z, kolei 
trafność zewnętrzna wymaga zbliżenia warunków badania do warunków życio- 
wych i prowadzenia badania na grupach reprezentatywnych. Przykładem niech 
będą badania poprowadzone przez Martina Seligmana nad skutecznością psycho- 
terapii metodą Consumer Reports (Seligman, 1996; krytycznie o tych badaniach: 
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Nathan, Stuart i Dolan, 2000; Jaworska, 2001). Co z tego, że badania poprowa- 
dzone na grupie reprezentatywnej (co na swoją obronę podkreślił Seligman) me- 
todą ankiety pocztowej miały stosunkowo wysoką trafność zewnętrzną, jeśli ich 
trafność wewnętrzna była nie do zaakceptowania (m.in. brak grupy kontrolnej). 

Podsumowując ten wątek „trafnościowy” mojego artykułu, zwróciłbym szcze- 
gólną uwagę na źródła niskiej trafności badań prowadzonych przez klinicystów: 

— trafność wewnętrzna: brak grupy porównawczej (kontrolnej), brak rando- 
mizacji; 

— trafność zewnętrzna: niska reprezentatywność próby, niska reprezentatyw- 
ność warunków badania. 

Czy można, aby uzyskać bliższy oczekiwaniom, jeden rodzaj trafności 
przedłożyć nad drugi — trafność zewnętrzną nad trafność wewnętrzną — jak to 
zdają się czynić klinicyści? Odpowiem jak metodolog. Nie można, bo co z tego, 
że uzyskano wysoką trafność zewnętrzną rezultatów badawczych, które są dość 
wątpliwe, jeśli chodzi o ich trafność wewnętrzną. Jednocześnie zdaję sobie 
sprawę z tego — też jako metodolog — że nie da się w pełni pogodzić wymogu 
dopełnienia obu warunków jednocześnie. Tak się może zdarzyć jedynie w świe- 
cie wyidealizowanym, ale ten, nas otaczający, jest taki, jaki jest. Badacz może 
jedynie próbować uzyskanie pewnego kompromisu. Może też poświęcić „„trochę” 
jeden rodzaj trafności na rzecz drugiego. 

Sumując, empiryczna teoria psychologiczna i „towarzyszące” jej teorie (mo- 
dele) — statystyczny i psychometryczny — kształtują badanie naukowe jako: 

— źródło definicji zmiennych, 

— podstawa operacjonalizacji zmiennych (nadawania im sensu empirycznego), 

— rama interpretacji ilościowej (statystycznej) zebranych danych, 

— rama interpretacji psychologicznej wyniku badawczego (traktowanego jako 
zagregowane dane empiryczne). 


Od empirycznej teorii psychologicznej 
do EBA i EBPP 


Od lat 90. ubiegłego wieku, wzorując się na medycynie”, kładzie się szcze- 
gólny nacisk na to, aby formułowane przez psychologów diagnozy oparte były 
na dowodach empirycznych (Evidence-Based Assessment, EBA; por. Stemplew- 


? W kwietniu 2015 r. brałem udział w debacie (poprowadzonej według formuły Oxford Union 
Debate: „This house believes that...”) zorganizowanej przez redakcję czasopisma Nowotwory. 
Journal of Oncology. Ich uczestnicy zostali poinformowani, aby prezentowali swoje stanowiska: 
„[...] w duchu evidence-based medicine, tj. na podstawie wiarygodnych i aktualnych badań na- 
ukowych [...]”. 


O OSOBLIWOŚCIACH METODOLOGICZNYCH BADAŃ NAUKOWYCH 447 


ska-Żakowicz i Paluchowski, 2008; Stemplewska-Żakowicz, 2009; Paluchowski, 
2010). Ten model postępowania diagnostycznego wpisał się w ogólniejszy model 
praktyki psychologicznej opartej na dowodach empirycznych (Evidence-Based 
Practice in Psychology, EBPP), który American Psychological Association 
w 2006 r. (por. APA, 2006) zdefiniowała następująco: „Evidence-based practice 
in psychology (EBPP) is the integration of the best available research with clin- 
ical expertise in the context of patient characteristics, culture, and preferences” 
(s. 273). 

Tak naprawdę to w polskiej psychologii klinicznej, w dużym stopniu formo- 
wanej przez prace Andrzeja Lewickiego (lata 60. ubiegłego wieku — por. Lewic- 
ki, 1969), od dawna wzorowano diagnozę na procesie badawczym, a więc z do- 
minującą rolą teorii i rzetelnej metodologii (por. np. Brzeziński i Kowalik, 1991; 
Kowalik i Brzeziński, 199la, 1991b). Pisał przed laty założyciel pierwszej pol- 
skiej Katedry Psychologii Klinicznej na Uniwersytecie im. Adama Mickiewicza 
w Poznaniu, A. Lewicki (1969, s. 84): 


Z metodologicznego punktu widzenia diagnostyczne postępowanie psychologa klinicznego 
należy określić jako formę badania naukowego, zastosowanego do rozwiązania praktycz- 
nych problemów klinicznych. Istotą każdego badania naukowego jest: a) postawienie proble- 
mu, b) wysunięcie hipotezy, tj. prawdopodobnego rozwiązania problemu, c) weryfikacja hipo- 
tezy przez zastosowanie odpowiednich metod badawczych. Badanie kliniczne spełnia te po- 
stulaty [wyróżn. — J. M. B.]. 


Czy nie mamy tu do czynienia z wizją EBA? Owszem, zgadzam się z mode- 
lem EBA, jeśli chodzi o standard postępowania diagnostycznego, a szczególnie 
jeśli chodzi o eliminowanie z instrumentarium psychologów (zwłaszcza tych 
klinicystów, którzy jak zaczarowani przywiązali się do szamańskich praktyk 
diagnostycznych odwołujących się do takich pseudotestów psychologicznych, 
jak Test Szondiego, Test Kolorów Liischera czy Test Drzewa Kocha). Podpisuję 
się pod rzetelną krytyką tych „testów” przeprowadzoną przez Katarzynę Stem- 
plewską-Żakowicz (2009); trzeba zauważyć, że te trzy „testy” nie wyczerpują 
owej czarnej listy naukowo nieuprawnionych narzędzi diagnostycznych, z upo- 
dobaniem stosowanych przez sporą część społeczności klinicystów. Ważnym 
uzupełnieniem tej listy mogłaby być druga czarna lista procedur, za pomocą któ- 
rych niedouczeni czy goniący za tanim zyskiem (np. przeróżne „gabinety psy- 
chologiczne”) paraklinicyści oddziaływają na swoich naiwnych klientów; tu 
znalazłoby się miejsce dla ustawień rodzinnych Berta Hellingera, NLP czy prze- 
różnych magicznych praktyk psychoanalitycznych. Nie uważam, aby spełniały 
one kryteria EBPP. 
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Władysław J. Paluchowski (2010, s. 11), charakteryzując jedną z istotnych 
osobliwości modelu EBA, pisze, że odrzuca się w nim założenie, iż: 


[...] obserwacje pochodzące z praktyki klinicznej (własnej lub innych osób) stanowią wiary- 
godne i wystarczające Źródło praktycznej wiedzy medycznej. Osobiste doświadczenie 
i praktyka są przeceniane co do ich wartości, zawsze bowiem mają one charakter lokalny, 
ograniczony do przypadków niereprezentatywnych dla wszystkich pacjentów, ale — kontek- 
stowo — dobranych (próba obciążona, stronnicza), a ich ocena zależy od specyficznych cech 
podmiotowych lekarza (rodzaj wykształcenia czy preferencja poznawcza). Ponadto bazowa- 
nie na doświadczeniu autorytetów częściej ma za podstawę wiarę niż mądrość, która zastępo- 
wana bywa przez utrwalone stereotypy i modę (Sułkowski, 2007). 


Moim zdaniem odnosi się to też do tradycyjnej praktyki klinicystów. 

Chciałbym jednak, aby znacząco wyraziściej zaakcentowano rolę empirycz- 
nej teorii psychologicznej, gdyż to ona, przede wszystkim, przesądza o wartości 
diagnozy psychologicznej (także klinicznej). To należyte wyeksponowanie teorii 
znalazło się w przygotowanych przez Sąd Najwyższy USA tzw. kryteriach 
Dauberta, które są stosowane wobec ekspertyz sądowych w sądownictwie ame- 
rykańskim. Owe siedem kryteriów Dauberta (seven Daubert guidelines; za: 
Ritzler, Erard i Pettigrew, 2002, s. 202-203) to: 


1) Czy proponowana teoria (lub technika), na której ma być oparte zeznanie, jest sprawdzalna? 

2) Czy proponowana teoria (lub technika) została przetestowana przy użyciu trafnych i rzetel- 
nych procedur, z pozytywnym rezultatem? 

3) Czy proponowana teoria (lub technika) została poddana recenzji? 

4) Co wiadomo na temat oszacowania potencjalnej wielkości błędu w przypadku tej teorii lub 
techniki? 

5) Jakie standardy, służące do kontroli działania proponowanej techniki, maksymalizują jej 
trafność? 

6) Czy proponowana teoria (lub technika) została ogólnie zaakceptowana jako trafna przez 
właściwe środowisko naukowe? (Grove i Barden, 1999, s. 226) 

7) [Dodane później] Czy wnioski eksperta wynikają w uzasadniony sposób z zastosowania 
w danym przypadku tej teorii (lub techniki)? (Grove i Barden, 1999, s. 226) [wyróżn. 
—J. M.B.]. 


Zauważmy, że terminem najczęściej się powtarzającym jest „teoria”. Jeżeli 
klinicyści sporządzający ekspertyzy (np. dla sądów: orzekanie o poczytalności, 
seksuologia, rozwody itp.) nie będą nadążać za rozwojem teoretycznym i meto- 
dologicznym psychologii (teorie i narzędzia), to skazują się na ośmieszenie (np. 


3 Jasson Daubert i Eric Schuler wystąpili z pozwem sądowym przeciwko koncernowi far- 
maceutycznemu Merrell Dow Pharmaceuticals Inc., gdyż uznali, że na skutek brania przez ich 
matki w okresie ciąży leku Bendectin urodzili się z fizycznymi uszkodzeniami ciała. Sąd posta- 
nowił w tym postępowaniu, aby sporządzane przez specjalistów ekspertyzy były zgodne z kry- 
teriami, nazwanymi kryteriami Dauberta właśnie. Te kryteria stały się zaleceniami dla sędziów 
w sądownictwie amerykańskim. 
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trzymając się kurczowo testu Kocha) i wykluczenie z poważnych debat i profe- 
sjonalnych zleceń (chociaż niekoniecznie z łatwych zarobków). 


Konkluzja 


Praktyka badawcza psychologów klinicznych (naukowa i diagnostyczna) 
jeszcze nie w pełni oparta jest na standardach metodologicznych empirycznej 
psychologii, w której nie ma miejsca na niewiele mające wspólnego z nauką 
spekulacje samozwańczo mianujące się „teoriami” — często o proweniencji psy- 
choanalitycznej (a ta, jak pokazał K. Popper, odstaje od racjonalnego modelu 
nauki — nie jest falsyfikowalna). 

O naukowości klinicznego badania naukowego (też diagnostycznego) (jak 
starałem się to ukazać, omawiając Rysunek 1 — eksponującą rolę: empirycznej 
teorii psychologicznej, modeli psychometrycznych i modeli statystycznych) 
przesądza w dużej mierze oparcie się na empirycznie sprawdzonej teorii psycho- 
logicznej. 

Praktyka diagnostyczna odwołuje się dziś do standardów EBA; odwołuje się 
też (zob. kryteria Dauberta) do sprawdzonych teorii i poprawnie skonstruowa- 
nych, dostarczających replikowanych wyników (to też dość skuteczna zapora 
przed oszustwami naukowymi) narzędzi. W ich zbiorze nie ma miejsca na prze- 
konanie o swoich szczególnych kompetencjach wynikających z lat praktyki czy 
osobiste odczucia i wrażenia z kontaktu z osobami badanymi jako źródła rzetel- 
nych danych empirycznych (por. listę Multiple Types of Research Evidence, za- 
mieszczoną w raporcie APA Presidential Task Force on Evidence-Based Practice, 
2006, s. 274). 

Doskonalenie praktyki badawczej klinicystów — to rozwijanie rzetelnego 
warsztatu i pozyskiwanie replikowalnych danych. 
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